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摘 要 : [目的 /意义 ] 针对 现 有 规模 化 猪 场 生猪 计数 需求 场景 多 ， 人 工 计 数 效 率 低 、 成 本 高 等 问题 ， 提 出 一 种 基 
于 改进 实例 分 割 深度 学 习 算 法 和 微 信 公众 平台 的 区 域 养殖 生猪 计数 方法 。[ 方 法 ] 首先 ， 利 用 智能 手机 拍摄 养殖 场 
猪 只 视频 ， 对 视频 抽 帧 进一步 生成 图 像 数 据 集 。 其 次 ， 通 过 改进 卷 积 块 注意 力 模 块 (Convolutional Block Attention 
Module, CBAM) 中 忽略 通道 与 空间 相互 作用 及 通道 注意 力 中 降 维 操作 带 来 的 效率 较 低 问题 ， 提 出 高 效 全 局 注意 力 
模块 ， 并 将 该 模块 引入 基于 回归 分 析 的 单 阶段 实例 分 割 网 络 YOLO (You Only Look Once) v8 中 对 获取 的 生猪 图 像 
进行 分 割 ， 构 建新 的 识别 模型 YOLOv8x-Ours， 以 实现 高 精度 的 生猪 计数 。 最 后 ， 基 于 微 信 公 众 平台 开发 微 信 小 
程序 ， 并 和 藤 入 综合 表现 最 优 的 生猪 计数 模型 ， 实 现 使 用 智能 手机 拍摄 图 像 进 行 生 猪 快速 计数 。[ 结 果 和 讨论 ] 在 测 
试 集 上 的 试验 结果 表明 ， 与 现 有 实例 分 割 模型 相 比 ， 引 入 高 效 全 局 注意 力 的 YOLOv8x-Ous 模型 获得 66% 的 平均 精 


Jul. 2024 Vol. 6, No. 4 


FE (AP ,sw 2. 平均 绝 对 误差 (Mean Absolute Error, MAE ) 、 均 方 根 误差 (Root Mean Square Error, RMSE) 和 了 分 


别 为 1.727、2.168 和 0.949， 表 现 出 较 高 的 准确 性 和 稳定 性 。 模 型 计算 猪 只 净 


量 误差 小 于 3 头 猪 的 图 像 数 量 占 测试 


图 像 总 数量 的 93.8% ， 相 比 两 阶段 实例 分 割 算 法 Mask R-CNN (Region Convolutional Neural Network) 提升 7.6%; 单 
幅 图 像 平 均 处 理 时间 仅 为 64 ms， 是 Mask R-CNN 的 1/8。[ 结 论 ] 该 方法 经 济 高 效 ， 为 规模 化 猪 场 的 生猪 计数 提供 


了 一 种 技术 方案 。 
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生猪 养殖 是 畜牧 业 的 重要 组 成 部 分 。 猪 肉 是 国 
内 人 们 最 主要 的 动物 蛋白 来 源 ， 也 是 最 主要 的 肉 类 
食品 ， 约 占 国民 人 均 肉 类 消费 量 的 60%。 然 而 ， 受 
疾病 和 环保 政策 等 影响 ,虽然 目前 生猪 养殖 模式 以 
散 养 为 主 ， 但 规模 化 、 现 代 化 养殖 逐渐 成 为 主 趋 
势 。 根 据 舍 内 猪 只 数量 进行 精准 化 饲养 和 管理 ， 对 
规模 化 养殖 有 着 重要 意义 。 

目前 ， 养 殖 公司 是 以 人 工 统 计 的 方式 进行 出 栏 
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量 和 存栏 量 的 资产 盘点 ， 费 时 费力 ， 且 往往 由 于 猪 
只 跑 动 导致 错误 计数 并 存在 作弊 问题 。 随 着 养殖 规 
模 的 不 断 扩 大 ， 周 期 性 的 活体 资产 盘点 工作 导致 养 
殖 企业 面临 人 力 、 物 力 、 财 力 及 时 间 紧 迫 的 多 重 压 
力 。 采 用 电子 耳 标 获取 猪 只 信息 可 以 实现 生猪 计 
数 。 但 生猪 在 群 养 过 程 中 耳 标 易 坏 易 掉 ， 导 致 计数 
结果 不 准确 ， 并 且 耳 标 属于 入 侵 式 传 感 设 备 ， 易 导 
致 细菌 感染 ,使 得 猪 只 产生 较为 强烈 的 应 激 反 应 。 
随 着 深度 学 习 技 术 的 不 断 发 展 ， 卷 积 神经 网 
络 路 、 视 觉 自 注意 力 模 型 (Vision Transformer, 
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ViT) 7 等 深度 学 习 算 法 在 计算 机 视觉 任务 中 表现 
优异 。 越 来 越 多 的 研究 将 深度 学 习 算法 应 用 到 农业 
和 畜牧 业 盘 点 计数 领域 。 通 过 人 工 智 能 计算 猪 只 的 
方式 ， 自 动 统计 养殖 场 每 天 /每 周 的 生猪 出 栏 量 和 
存栏 量 ， 在 一 定 误 差 允 许 范 围 内 可 免 去 人 工 点 数 费 
时 费力 的 问题 ， 达 到 机 器 蔡 代 人 工 的 目的 ， 有 利于 
养殖 场 加 强 对 养殖 过 程 的 监管 ， 减 少 人 力 投 入 和 管 
理 成 本 。Chen 等 ”提出 了 一 种 自 底 向 上 的 猪 只 身 
体 关 键 点 检测 方法 ， 并 基于 空间 感知 时 序 响 应 对 视 
频 流 中 的 猪 只 进行 计数 。Tian 等 ”根据 ResNeXt ^ 
学 习 从 图 像 特征 到 密度 图 的 映射 关系 ， 通 过 整合 密 
度 图 获得 了 图 像 中 猪 只 的 总 数 ， 对 于 每 幅 图 像 中 平 
均 有 15 头 猪 只 的 数据 集 获 得 了 1.67 的 平均 绝对 误 
差 。 高 云 等 “通过 添加 空间 金字 塔 结构 改进 人 和 群 
计数 网 络 GSRNet (Genomic Signals and Regions) ”, 
有 效 提高 了 高 密度 猪 只 的 计数 精度 。Kim 等 ”基于 
深度 学 习 视 频 检测 和 跟踪 方法 对 猪 场 走廊 摄像 头 的 
视频 流 进行 分 析 ， 实 现 了 统计 通过 计数 区 的 猪 只 类 
w, 计数 准 确 率 达 到 99.44%。Miso 等 使 用 YO- 
LO (You Only Look Once) 网 络 检测 目标 猪 只 ， 再 
结合 Kinect 深 度 相 机 实现 猪 只 的 实时 分 割 。 王 到 
等 … 融合 多 尺度 特征 金字 塔 网 络 和 可 变形 卷 
积 ， 解 决 猪 只 间 粘 连 、 遗 挡 等 问题 ， 在 科大 讯 
飞 公 开 的 生猪 盘点 数据 集 的 分 割 准 确 率 达 到 96.7%。 
Xu “ > 使 用 Mask R-CNN (Region Convolutional 
Neural Network) |") X} py We S& Jo A HLA He AY AE EA 
像 进行 分 割 和 盘点 计数 ， 对 畜牧 的 分 类 准确 率 为 
96%， 冀 牧 数量 估计 精度 达到 92%。Sarwar 等“ 
使 用 全 卷 积 神经 网 络 分 割 无 人 机 捕获 的 航空 图 像 中 
的 牲畜 个 体 ， 相 比 FCN (Full Connected Network) , 
召回 率 从 90% 提 升 至 98%。 胡 云 鸟 等 ' 将 Mask R- 
CNN 网 络 的 底层 边缘 位 置 特征 与 高 层 特征 相 融 合 ， 
以 提升 网 络 对 猪 只 边缘 轮廓 的 识别 能 万 。 以 上 方法 
从 俯视 角度 拍摄 图 像 ， 需 要 在 猪 舍 每 个 猪 栏 上 方 安 
装 摄像 设备 或 使 用 无 人 机 进行 拍摄 ， 成 本 需求 
较 大 。 

针对 上 述 人 工 点 数 效 率 低 、 电 子 耳 标 伤 害 猪 只 
且 容 易 脱 落 、 传 统 图 像 处 理 精 度 低 和 俯视 角度 采集 
图 像 成 本 大 等 现 有 生猪 计数 方法 的 问题 ， 为 贴 合 规 
模 化 猪 场 区 域内 生猪 计数 任务 的 需求 ， 本 研究 利用 
深度 学 习 实 例 分 割 算法 和 微 信 公众 平台 ， 提 出 一 种 
高 效率 且 低 成 本 的 生猪 计数 方法 。 主 要 工作 包括 : 
D 使 用 智能 手机 采集 区 域内 生猪 图 像 数 据 ; 2) 在 
YOLOv8 中 引入 本 研究 提出 的 高 效 全 局 注意 力 模块 


构建 生猪 计数 实例 分 割 网 络 ， 并 通过 实验 发 现 生 猪 
计数 的 最 优 深度 学 习 模 型 ; 3) 依托 微 信 公 众 平台 ， 
开发 “生猪 计数 ” 微 信 小 程序 ， 实 现 拍摄 区 域内 生 
猪 图 像 并 计数 ; 4) 在 小 程序 添加 用 户 交 互 功 能 ， 
对 于 图 像 中 深度 学 习 模型 漏 检 错 检 的 生猪 ， 允 许 用 
户 点 击 相应 生猪 位 置 进 行 增加 和 减少 计数 结 


1 材料 与 方法 


1.1 数据 采集 


于 2022 年 10 月 在 正邦 集团 有 限 公 司 旗下 猪 场 
进行 数据 采集 。 采 集 目 标 为 猪 舍 中 每 个 猪 栏 内 的 群 
养 猪 只 。 使 用 智能 手机 的 后 置 摄像 头 模拟 人 的 视角 
进行 视频 数据 的 采集 ， 拍 摄 时 摄像 头 位 于 拍摄 人 的 
面部 前 方 。 共 采集 视频 数据 70 段 ， 每 段 视频 时 间 
长 度 为 8~92 s， 分 辨 率 为 720X1 280 像 素 ， 帧 速率 
为 30 帧 /s， 使 用 MP4 格 式 储存 。 


1.2 数据 集 构建 


对 采集 的 群 养 猪 只 视频 数据 ， 通 过 编写 代码 以 
15 帧 的 间隔 抽取 视频 中 的 图 像 ， 并 剔除 过 度 相 似 、 
模糊 和 两 个 栏 位 之 间 的 图 像 以 构建 数据 集 。 最 终 获 
得 671 幅 图 像 ， 并 按 9 : 1 划分 训练 集 (606 幅 ) 和 
测试 集 (65 幅 )。 数 据 集 在 自然 光 及 较 暗 的 灯光 场 
景 下 采集 。 图 像 中 的 猪 只 包括 2~3 月 龄 的 保育 猪 和 
体型 较 大 的 育肥 猪 。 猪 只 状态 包含 进食 、 站 立 、 
坐 、 趴 卧 、 打 阅 及 相互 遮挡 等 。 数 据 集 的 部 分 示例 
如 图 1 所 示 。 

使 用 Labelme 标 注 工具 ， 通 过 鼠标 沿 图 像 中 每 
头 猪 只 的 轮廓 框 选 出 多 边 形 进行 标注 。 多 边 形 的 每 
个 点 以 坐标 点 的 形式 储存 ， 标 注 文件 为 JSON 格 式 ， 
每 幅 图 像 中 多 边 形 的 个 数 为 猪 只 的 真实 个 数 。 
共计 标注 13 655 头 猪 只 。 单 张 图 像 中 猪 只 计数 范围 
4~-63 头 。 生 猪 计 数 数 据 集 如 表 1 所 示 。 


1.8 生猪 自动 计数 模型 构建 


本 研究 提出 了 一 种 使 用 智能 手机 拍摄 区 域 养 
殖 生猪 图 像 的 生猪 计数 方法 。 通 过 改进 卷 积 块 注 
意 力 模块 (Convolutional Block Attention Module， 
CBAM) 中 忽略 通道 与 空间 相互 作用 及 通道 注意 力 
中 降 维 操作 带 来 的 效率 较 低 问题 ， 提 出 高 效 全 局 注 
意 力 模块 ， 并 将 该 注意 力 引 入 基于 回归 分 析 的 单 阶 
段 实 例 分 割 网 络 YOLOv8 中 对 获取 的 生猪 图 像 进行 
检测 ， 实 现 高 精度 的 生猪 计数 。 
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segmentation algorithm 
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测试 集 65 2 046 10 46 


,主干 网 络 Head 
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图 1 生猪 计数 数据 集 示例 
Fig. 1 Examples of pig counting dataset 


表 1 改进 实例 分 割 算法 的 生猪 计数 数据 集 


Table 1 Pig count dataset created in improved instance 


1.3.1 YOLOv8 

YOLOv8 是 Ultralytics 开发 的 目标 检测 和 图 像 
分 割 模型 的 最 新 版 本 "” ， 建 立 在 现 有 YOLO 版 本 
的 基础 上 ， 引 入 新 的 主干 网 络 、 新 的 Anchor-Free 
检测 头 和 新 的 损失 函数 ， 并 能 人 够 在 各 种 硬件 平台 上 
运行 ， 其 结构 如 图 2 所 示 。 
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图 2 生猪 计数 的 改进 的 YOLOv8 网 络 结构 图 
Fig. 2 Structure of the improved YOLOv8 Network for pig counting 


相 比 之 前 的 版 本 ，YOLOv8 在 主干 网 络 和 Head 
中 使 用 C2f 蔡 换 所 有 C3 模块 ， 增 加 更 多 的 跳 层 连接 
和 Split 操 作 ， 实 现 进一步 轻 量化 的 同时 获得 更 加 丰 
富 的 梯度 流 信 息 。 主 干 网 络 使 用 快速 空间 金字 塔 池 
15 (Spatial Pyramid Polling-Fast, SPPF) 模块 进行 
特征 提取 ， 相 比 空间 金字 塔 池 化 (Spatial Pyramid 


Polling, SPP)  ， 模 型 的 计算 量变 小 以 提升 计算 速 
度 。 在 Head 模块 中 ，YOLOv8 对 检测 和 分 类 进行 
解 耘 ， 采 用 不 同 的 分 支 进行 运算 以 提升 模型 精度 。 
同时 使 用 Anchor-Free， 不 需要 预 设 Anchor， 只 对 
不 同 尺度 的 特征 图 的 目标 中 心 点 和 宽 高 进行 回归 ， 
极 大 地 提升 了 运算 速率 。 本 研究 中 采用 CIOU_Loss 
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(Complete Intersection over Union Loss) |") 和 非 对 
FK Dil £X AY DFL_Loss (Distributional Feature Loss) 
PEA IRR RT PRB, STR TUES. EAA RB 
测 性 能 。 
1.3.2 高效 全 局 注意 力 模块 

CBAM 通 过 学 习 的 方式 获取 每 个 特征 通道 和 空 
间 的 重要 程度 ， 以 此 来 提升 特征 并 抑制 对 当前 任务 


不 重要 的 特征 。CBAM 的 局 限 主 要 有 : 1) 忽略 了 
特征 通道 与 空间 的 相互 作用 ， 从 而 丢失 跨 维 信息 。 
2) 在 通道 注意 力 模块 中 ， 使 用 两 层 全 连接 的 降 维 
操作 对 通道 注意 力 的 预测 产生 负面 影响 ， 且 计算 成 
本 高 。 对 此 ， 本 研究 提出 了 一 种 高 效 全 局 注意 力 模 
块 ， 其 结构 如 图 3 所 示 。 


MaxPool , 
AvgPool 
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图 3 高 效 全 局 注意 力 模块 结构 图 


Fig. 3 Structure of efficient global attention module 


高 效 全 局 注意 力 模块 依次 进行 通道 和 空间 注意 
力 操 作 ， 在 通道 注意 力 子 模块 中 ， 为 获取 输入 特征 
F e R*“**# 通 道 与 空间 维度 的 相互 作用 ， 首 先 使 
用 维度 置换 操作 将 输入 特征 的 维度 转换 为 WXHHX 
C， 对 转换 后 的 特征 使 用 全 局 平均 池 化 (Global Av- 
erage Pooling, GAP) 进行 聚合 ， 使 用 一 维 卷 积 代替 
CBAM 中 的 全 连接 操作 ， 避 免 降 维 的 同时 极 大 地 降 
低 了 模型 的 参数 量 ， 再 使 用 sigmoid 激活 函数 并 与 
特征 进行 对 应 位 置 乘 积 ， 最 后 执行 反 向 置换 得 到 中 
间 特 征 Ff.， 通 道 注意 力 子 模块 可 以 表示 为 
公式 (1)。 
下 .= 
permute'{ c (Conv1D [ GAP ( permute ( F)) ]) 
G permute (F) } (1) 
IP: permute 和 permnute' 分 别 为 维度 置换 和 反 
向 置换 操作 ; c 为 sigmoid 激 活 函 数 。 
空间 注意 力 子 模块 与 CBAM 类 似 ， 对 中 间 特 征 
下 .在 通道 维度 分 别 使 用 平均 池 化 和 最 大 池 化 ， 将 产 
生 的 特征 图 进行 拼接 (concat) ， 然 后 在 拼接 后 的 特 
征 图 上 使 用 卷 积 操作 产生 最 终 的 空间 注意 力图 ,与 
到 .进行 对 应 位 置 乘积 后 得 到 输出 特征 天 ， 空 间 注 意 
力 子 模块 表示 为 公式 (2)。 
MaxPool (F.) 
M 


本 研究 通过 将 高 效 全 局 注意 力 模块 添加 至 YO- 
LOv8 主干 网 络 的 每 个 C2f 层 来 构建 生猪 计数 网 络 模 


F = o $Conv2D (2) 


型 ， 可 以 更 加 有 效 地 提取 图 像 中 的 维度 依赖 关系 和 
特征 信息 ， 从 而 实现 高 精度 的 生猪 计数 。 


1.4 生猪 计数 小 程序 开发 


针对 养殖 场 高 效率 、 低 成 本 的 要 求 ， 本 研究 基 
于 微 信 公 众 平台 和 了 Django Web 框架 开发 生猪 计数 
微 信 小 程序 ， 人 藤 入 本 研究 提出 的 计数 模型 ， 通 过 微 
信 平 台 使 用 智能 手机 拍摄 图 像 实现 生猪 计数 任务 。 
微 信 小 程序 具有 无 需 安装 、 用 时 随时 打开 、 不 占用 
手机 空间 、 功 能 实现 完全 可 以 与 App 媲 美 等 优点 ， 
FPA SE 11 亿 微 信 用 户 ， 共 享 微 信 传播 生态 (AR 
号 、 服 务 号 、 订 阅 号 、 朋 友 圈 等 ) ， 从 用 户 和 开发 
角度 出 发 都 非常 适合 应 对 当前 任务 需求 。 微 信人 小 程 
序 计 数 方法 技术 路 线 如 图 4 所 示 ， 主 要 包含 以 下 
功能 : 

1) 登录 。 用 户 进 入 生猪 计数 小 程序 ， 进 行 授 
权 登 录 。 

2) 创建 猪 场 结 构 。 新 用 户 根据 猪 场 布局 ， 创 
建 猪 仓 - 猪 含 - 猪 栏 3 级 结构 。 

3) 获取 图 像 。 选 择 需 要 统计 生猪 数量 的 猪 栏 ， 
对 其 进行 拍照 或 从 相册 中 选取 对 应 的 图 像 。 

4) 统计 数量 。 将 照片 输入 最 优 的 生猪 计数 模 
型 ， 根 据 模型 的 预测 结果 统计 图 像 中 生猪 数量 。 

5) 用 户 交互 。 生 猪 计 数 要 求 准确 率 高 ， 对 于 
模型 存在 错 检 漏 检 的 情况 ， 人 允许 用 户 点 击 错误 位 置 
修改 生猪 数量 。 
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6) 历史 记录 。 碍 看 历史 计数 信息 ,包括 栏 位 
信息 、 检 测 时 间 、 计 数 结果 图 像 和 计数 结 


创建 猪 场 结构 选择 栏 位 
相册 选取 /拍摄 疼 像 


正确 


c 


图 4 生猪 计数 微 信 小 程序 设计 技术 路 线 图 


Fig.4 Technical route for pig counting WeChat mini program 


生猪 计数 小 程序 的 前 端 页 面 及 页 面 间 的 跳 转 和 
数据 传递 功能 使 用 微 信 公众 平台 的 微 信 开 发 者 工具 
进行 开发 。 小 程序 对 数据 库 的 增删 改 碍 和 拍摄 图 像 
的 检测 功能 通过 https 接 口 的 请 求 与 响应 实现 ,使 用 
Django Web 框 架 完成 开发 。 图 5 为 生猪 计数 小 程序 
的 主要 操作 界面 。 图 $a 为 小 程序 的 主 界面 ， 主 要 包 
括 “ 用 户 信息 的 显示 及 拍摄 计数 、 统 计 历 史 、 编 辑 
猪 栏 和 关于 我 们 ”功能 ;点 击 拍摄 计数 按钮 ， 用 户 
需要 选择 进行 计数 的 猪 栏 位 置 ， 如 图 5b 所 示 ; 选 
择 完 成 后 进行 区 域内 猪 只 图 像 拍 摄 ， 小 程序 调用 智 
能 手机 的 后 置 摄像 头 进行 拍摄 ， 获 取 的 图 像 通过 
request 方 法 的 POST 请 求 方式 发 送 到 后 端 代码 ， 通 
过 调用 训练 好 的 计数 模型 对 图 像 中 的 猪 只 进行 检 
测 ， 最 后 得 到 图 像 分 割 和 计数 结果 ， 如 图 5c 所 示 ， 
用 户 可 以 通过 双 指 操作 实现 对 分 割 图 像 的 缩放 ， 以 
便于 更 清楚 地 观察 图 像 中 小 猪 只 和 堆 羞 猪 只 的 分 
HER; 对 于 存在 错 检 漏 检 的 统计 ， 长 按 结果 图 
像 1s 进 入 修改 结果 界面 ， 如 图 5d 所 示 ， 点 击 模型 
分 割 出 错位 置 修改 相应 的 统计 结果 ; 点 击 统计 历史 
按钮 可 以 查看 所 有 猪 栏 统计 历史 信息 ， 如 图 5e 所 
示 ; 选择 编辑 猪 栏 按钮 ， 对 猪 场 的 猪 仓 、 猪 铭 和 猪 
栏 进行 增删 改 查 操作 ， 如 图 5f 所 示 。 


1.5 实验 环境 配置 


实验 在 Windows 10 操 作 系 统 上 进行 ， 处 理 器 
为 16 核 mtel (R) Core (TM) i9-9900K CPU @ 
3.60 GHz, 4 F Pytorch 1.9.1 框架 搭建 生猪 计数 深 
度 学 习 算 法 ， 使 用 1 块 NVIDIA GeForce GTX 


保育 仓 2 mé REN 


a. 小 程序 主 界面 


保育 仓 1 MEI AE 
计数 结果 : 14 


新 增 / 修 改 猪 仓 


保育 合 1 猪 合 1 猪 栏 2 


计数 结果 : 12 


RECI 猪 舍 1 猪 栏 3 
计数 结果 : 34 


RACI 猪 售 2 qw nV us és Y 
- | + 和 地 || sie || xam | 
Md 计数 结果 : 31 


SUR ES 


e. 历史 记录 f. 修改 猪 场 结构 
图 5 生猪 计数 微 信 小 程序 主要 操作 界面 
Fig. 5 Operation pages of pig counting WeChat mini program 
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2080Ti, 11 GB 显存 GPU 进行 训练 ，CUDA 版 本 为 S Gs) 
11.1，cuDNN 版 本 为 8.0.0。 微 信 小 程序 前 端 使 用 微 para (8) 


信 开 发 者 工具 进行 开发 ， 后 端 基 于 Django3.2 框架 
编写 功能 逻辑 代码 ， 使 用 MySQL 数据 库存 储 数据 ， 
版 本 为 8.0.21。 

网 络 训 练 使 用 SGD (Stochastic Gradient De- 
scent) 作为 优化 器 ， 最 大 迭代 次 数 100 次 ,动量 
0.9， 权 重 衰 减 为 0.000 5, batchsize 为 8， 输 入 图 像 
尺寸 为 640X640。YOLOv8 的 初始 学 习 率 为 0.01， 
Mask R-CNN 的 初始 学 习 率 为 0.005。 


1.6 评价 指标 


本 研究 从 模型 复杂 度 、 推 理 时 间 和 检测 效果 等 
方面 量化 分 析 生 猪 计数 网 络 模型 性 能 ， 主 要 包括 模 
型 参数 量 和 平均 每 幅 图 像 的 推理 时 间 。 平 均 精 度 
(Average Precision, AP) 用 于 衡量 对 一 个 类 检测 的 
好 坏 ， 其 结果 是 由 精确 率 (Precision, P) 和 召回 
率 (Recall, R) 组 成 的 PR 曲线 围 成 的 面积 。 计 算 
如 公式 (3) ~ 公式 (5) 所 示 。 


TP 

iom TP + FN (3) 
TP 

= TP + FP (4) 
1 

AP = | P(R)dR (5) 
0 


式 中 : TP (True Positive) 为 判断 正 样本 正确 
的 数量 ; FP (False Positive) 为 将 负 样 本 判断 为 正 
样本 的 数量 ; FN (False Negative) 为 将 负 样 本 判 
上 断 错 误 的 数量 。 根 据 IoU (Intersection over Union) 
取 值 不 同 ， 本 研究 报告 了 AP50 和 AP s: APSO 
为 IoU 的 值 取 50% 时 AP 结果 。AP ,,.,, 是 指 IoU 的 
值 以 5% 的 步 长 从 50% 取 到 95% ， 然 后 计算 这 些 
IoU 下 AP 的 均值 。 

为 评估 不 同 网 络 模 型 的 生猪 计数 性 能 ， 选 取 平 
均 绝 对 误差 (Mean Absolute Error, MAE), 137; He 
误差 (Root-Mean-Square Error, RMSE) 和 决定 系数 
R* 作 为 计数 效果 的 评价 指标 ， 对 65 幅 生猪 测试 图 像 
的 预测 结果 进行 评价 。 假 设 了 = S, So o Pel 


为 预测 值 ， Y= {y,, ya wess Ys } 为 真实 值 ， 了 为 了 
的 均值 ， 以 上 评价 指标 的 计算 如 公式 (6) 一 公 
X (8) 所 示 。 


1 65 
MAE = 一 
65 2, 


$i] (6) 


(7) 


式 中 : MAE 为 真实 值 与 预测 值 绝对 误差 的 平 
均值 ， 表 示 模 型 预测 的 准确 性 ，MAE 值 越 小 ， 模 
型 的 准确 度 越 高 ; RMSE 为 真实 值 与 预测 值 之 差 的 
样本 标准 差 ， 表示 模型 预测 的 稳定 性 ，RMSE 值 越 
小 ， 模 型 的 鲁 棱 性 越 高 ; 决定 系数 RR 反映 模型 的 拟 
合 程度 ， 取 值 范围 为 0~1， 值 越 接 近 1， 表 示 模 型 
对 数据 的 拟 合 能 力 越 强 。 


2 ”结果 与 讨论 


根据 模型 规模 从 小 到 大 ，YOLOv8 提供 YO- 
LOv8n, YOLOv8s, YOLOv8m, YOLOv8l, YO- 
LOv8x 这 5 种 网 络 结构 。YOLOv8n 是 最 小 最 快 的 模 
型 ; YOLOv8x 是 最 准确 但 最 慢 的 模型 。 根 据 生猪 
计数 任务 需求 ， 本 研究 使 用 YOLOv8x 作为 基础 模 
型 ， 引 入 CBAM (YOLOv8x-CBAM) 和 高 效 全 局 
注意 力 模 块 (YOLOv8x-Ours) ， 并 对 比分 析 Mask 
R-CNN, YOLACT (Real-time Instance Segmenta- 
tion) "" , PolarMask ” 和 SOLO (Segmenting Ob- 
jects by Locations) ” 实例 分 割 模型 的 性 能 。 


2.1 不 同 计数 模型 性 能 对 比分 析 
将 不 同 实例 分 割 模型 的 生猪 计数 网 络 在 测试 集 
上 进行 性 能 对 比 ， 结 果 如 表 2 所 示 。 
表 2 不 同 实例 分 割 模型 性 能 比较 


Table 2 Performance comparison of different instance 


segmentation models 


Pe F 单 幅 图 像 平 均 

网 络 模型 AP50 AP s.) 参数 量 /MB HERI ms 
YOLACT 0.689 0.399 292. 63 
PolarMask 0.742 0.422 36.3 151 
SOLO 0.811 0.537 46.2 113 
Mask R-CNN 0.900 0.644 43.7 500 
YOLOv5x 0.865 0.502 73.9 26 
YOLOv8x 0.897 0.636 68.2 44 

YOLOv8x- 

e AM 0.901 0.646 125.3 109 
YOLOv8x-Ours 0.901 0.660 71.7 64 


在 模型 规模 方面 ，YOLACT 参 数量 最 小 ， 为 
292 MB, YOLOv8x-CBAM 的 参数 量 最 大 ， 约 为 
YOLOv8x fj Pj fii, Tij YOLOv8x-Ours 相 比 YO- 
LOv8x 仅 增 加 3.5 MB. YOLOv8x-Ours 的 APSO 和 
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AP .ss 在 所 有 模型 中 取得 最 好 的 性 能 ， 并 且 YO- ”时 的 预测 结果 。 通 过 引入 注意 力 机 制 ， 生 猪 计数 模 
LOv8x-Ours 处 理 图 像 的 速度 比 Mask R-CNN 快 8 型 的 预测 结果 得 到 明显 的 提升 。 相 比 CBAM， 本 研 
音 。 本 人 研究 使 用 的 YOLOvV5 实例 分 制 模型 为 参数 规 。 究 提 出 的 高 效 全 局 注意 力 获得 更 好 的 表现 ， 在 得 分 
模 最 大 的 YOLOv5x， 其 处 理 图 像 的 速度 最 快 , OF ” 阅 值 取 0.15 时 ，YOLOv8x-Ours 获得 最 好 的 模型 准 
均 每 幅 图 像 仅 需 26 ms， 但 平均 精度 在 YOLO 系列 确 率 和 和 鲁 棒 性 。 在 其 他 实例 分 割 模型 中 ,，YOLACT 
的 模型 中 最 低 。 综 合 来 看 ，YOLOv8-Ours 与 其 他 模 ” ”预测 的 猪 只 数量 少 于 真实 值 且 得 分 均 大 于 0.9， 当 
型 相 比 具有 最 高 的 平均 精度 ， 且 在 处 理 图 像 速度 方 得 分 阅 值 取 较 小 数 时 ， 其 结果 保持 不 变 。Polar- 
面 有 比较 优异 的 表现 。 Mask, SOLO fill Mask R-CNN 分 别 在 得 分 阔 值 为 
side abge 0.35、0.3 和 0.35 时 的 预测 结果 最 优 。Mask R-CNN 
ee AEN cee aie near a 相 比 其 他 实例 分 割 模型 具有 更 好 的 表现 。YOLOv8- 
区 域 养殖 的 生猪 图 像 通 过 网 络 模型 预测 区 域内 ”Ours 在 所 有 模型 中 的 准确 率 、 稳 定性 和 拟 合 能 力 表 
生猪 的 位 置 和 掩 膜 。 掩 膜 的 个 数 即 为 图 像 中 生猪 的 。 现 最 佳 ， 比 Mask R-CNN 在 得 分 国 值 为 0.35 时 的 
个 数 ， 通 过 设置 分 数 闷 值 ， 删 除 目标 得 分 低 于 该 赣 MAE, RMSE 和 RR 分 别提 Ft 0.027, 0.198 和 
值 的 目标 来 控制 图 像 中 检测 的 生猪 个 数 。 表 3 为 0.005, 
YOLOv8 系列 和 其 他 实例 分 割 模型 在 不 同 得 分 阔 值 
表 3 不 同 阅 值 下 各 个 实例 分 割 模型 在 测试 集 上 的 预测 结果 


Table 3 Prediction results of instance segmentation models on the test set with different thresholds 


! 2 $55) EUER 
模型 评价 指标 
0.1 0.15 0.2 0.25 0.3 0.35 0.4 
MAE 7.125 7.125 7:125 7.125 
YOLACT RMSE = 8.369 8.369 8.369 8.369 
R? 0.327 0.327 0.327 0.327 
MAE | 5.512 5.578 2.853 4.157 
PolarMask RMSE = 7.132 6.596 3.775 5.018 
R 0.519 0.585 0.868 0.763 
MAE 3637 2913 3141 4.085 
SOLO RMSE = 4.792 3.634 4.066 4.978 
R 0.785 0.879 0.843 0.767 
MAE 1969 1.769 1.754 1.769 
Mask R-CNN RMSE = 2.649 2.421 2.366 2.376 
R 0.932 0.943 0.946 0.945 
YOLOv8x RMSE 2.826 2.715 3.153 3.526 5:713 = 
R? 0.922 0.928 0.903 0.879 0.866 
MAE 1.985 1.831 1.923 1.835 2.431 
YOLOv8x -CBAM RMSE 2.720 2.434 2.508 2.440 3.103 = 
R? 0.928 0.942 0.939 0.939 0.906 
YOLOv8x -Ours RMSE 2.651 2.375 2.168 2.380 3.005 = 
R 0:931 0.945 0.949 0.944 0.938 
HE: —" RREAN TE BL CRSA, REE MAE, RMSE FIR 


生猪 计数 结果 如 表 4 所 示 。 本 人 研究 分 别 统计 了 ” 像 的 数量 和 占 比 。 本 人 研究 模型 准确 计数 的 图 像 数 量 
各 个 模型 在 65 幅 测 试 集 图 像 上 准确 计数 、 误 差 小 “为 43 幅 ， 远 高 于 其 他 模型 ， 相 较 于 YOLOv8x， 准 
于 2 头 猪 、 误 差 小 于 3 头 猪 和 误差 大 于 2 头 猪 的 图 。 确 计数 的 图 像 数 量 增 加 12.4%。Mask R-CNN 准确 
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计数 的 图 像 数 量 优 于 YOLOv5x fll YOLOv8x, {H= 
者 误差 小 于 2 头 猪 和 3 头 猪 的 图 像 数 量 相 当 。 引 入 
CBAM 注意 力 机 制 的 YOLOv8x-CBAM 模 型 全 面 提 
JF f YOLOv8x 的 计数 精度 ,但 本 模型 在 计数 误差 


为 0、 小 于 2 头 猪 和 小 于 3 头 猪 的 图 像 占 比 表现 最 
优 ， 误 差 大 于 2 头 猪 的 图 像 仅 有 4 幅 ， 占 测试 集 图 
像 的 6.2%。 相 较 于 表 4 中 的 其 他 模型 ， 本 模型 实现 
了 区 域 养 殖 生猪 的 高 精度 盘点 计数 。 


表 4 不 同 实例 分 割 模型 在 测试 集 上 的 生猪 计数 结果 


Table 4 Pig cuouting results for different instance Segmentation models on the test Set 


is 准确 计数 的 图 像 误差 小 于 2 头 猪 的 图 像 误差 小 于 3 头 猪 的 图 像 误差 大 于 2 头 猪 的 图 像 
数量 占 比 /% 数量 占 比 /% 数量 占 比 /% 数量 占 比 /% 
YOLCAT 22 33.8 40 61.5 52 80.0 13 20.0 
YOLOv5x 29 44.6 48 73.8 56 86.2 9 13.8 
PolarMask 33 50.8 47 72.3 56 86.2 9 13.8 
SOLO 35 53.8 50 76.9 58 89.2 7 10.8 
YOLOv8x 35 53.8 49 75.4 57 87.7 8 12.3 
Mask R-CNN 37 56.9 49 75.4 56 86.2 9 13.8 
YOLOv8x-CBAM 41 63.1 51 78.5 59 90.8 6 9.2 
YOLOv8x-Ours 43 66.2 57 87.7 61 93.8 4 6.2 
2.3 结果 可 视 化 全 计数 正确 的 图 像 共 13 幅 ， 其 中 在 3 幅 牛 的 图 像 
在 微 信 小 程序 中 ， 通 过 模型 检测 得 到 生猪 个 (ED jp Dua onmia ect 


体 的 位 置 及 掩 膜 ， 为 方便 观察 模型 预测 结果 ， 对 
检测 到 的 每 只 生猪 掩 膜 使 用 不 同 颜 色 显 示 在 原始 
输入 图 像 。 生 猪 图 像 检 测 结果 可 视 化 如 图 6 所 示 。 
图 6a 中 模型 正确 统计 了 原 图 中 的 每 只 生猪 ; 图 6b 
中 模型 出 现 错 检 情况 ， 在 对 图 像 数 据 进 行人 工 标 注 
时 ， 由 于 猪 只 之 间 的 遮挡 、 图 像 边缘 不 完整 的 现 
象 ， 不 可 避免 地 会 将 猪 只 的 一 部 分 标注 为 待 分 割 的 
目标 类 别 ， 即 1 条 猪 腿 、1 只 猪 耳 甚至 1 条 猪尾 巴 都 
会 被 给 予 与 完整 猪 只 相同 的 监督 信号 ， 导 致 计数 结 
果 多 1 只 ， 在 微 信 小 程序 修改 结果 界面 选择 减少 按 
钮 ， 点 击 错误 位 置 以 修正 计数 结果 ; 图 6c 中 模型 漏 
检 了 原 图 中 左上 角 的 一 只 猪 ， 受 限于 本 数据 集中 图 
像 数 量 和 质量 方面 的 欠缺 ， 有 些 数 据 样本 即使 人 了 眼 
也 难以 分 辨 。 所 以 模型 在 面 对 一 些 失 焦 、 光 线条 件 
差 、 背 景 复杂 的 难 例 (如 图 6c 中 栏 位 远 端的 灯 下 区 
域 ) 时 会 产生 错 检 和 漏 检 等 问题 ， 在 微 信 小 程序 修 
改 结果 界面 选择 增加 按钮 ， 点 击 漏 检 位 置 以 修正 计 
数 结果 。 


2.4 模型 泛 化 能 力 比 较 


为 进一步 验证 本 模型 的 生猪 计数 能 力 ， 本 研究 
从 互联 网 下 载 17 幅 群 养 猪 只 图 像 及 3 幅 只 包含 牛 的 
图 像 进 行 生猪 计数 测试 。 计 数 结果 如 表 5 所 示 。 完 


进行 计数 ， 仪 有 1 幅 图 像 中 猪 只 计数 的 误差 为 3 只 
猪 。 图 7 展示 了 网 络 图 像 在 小 程序 中 的 计数 结果 ， 
验证 了 本 模型 具有 较 好 的 泛 化 能 力 以 及 稳定 性 。 


3 结 论 


本 研究 针对 规模 化 猪 场 区 域 养 殖 生猪 计数 问 
题 ， 通 过 在 单 阶段 实例 分 割 算法 YOLOv8 中 引入 本 
研究 提出 的 高 效 全 局 注意 力 模块 构建 生猪 计数 模 
型 ， 实 现 对 区 域内 的 生猪 计数 。 结 果 表 明 : 本 研究 
提出 的 生猪 计数 模型 的 准确 率 和 稳定 性 方面 表现 最 
优 ,在 测试 集 上 ， 本 模型 在 准确 计数 、 误 差 小 于 2 
头 猪 和 误差 小 于 3 头 猪 的 图 像 占 比 均 最 高 ， 计 数 误 
差 小 于 3 头 猪 的 图 像 数 量 占 总 测试 网 像 的 93.8% , 
相 比 两 阶段 实例 分 割 算法 Mask R-CNN 和 引入 
CBAM 注意 力 机 制 的 YOLOv8x 模 型 分 别提 升 7.6% 
和 3%。 并 且 由 于 YOLOv8 模 型 的 单 阶段 检测 和 An- 
chor-Free 结构 ， 单 幅 图 像 的 处 理 速 度 为 64 ms, FE 
Mask R-CNN 的 1/8。 综 合 实验 分 析 ， 为 满足 高 效 
率 、 低 成 本 的 任务 需求 ， 通 过 将 在 测试 集 上 表现 最 
优 的 模型 借入 开发 的 微 信 小 程序 ， 实 现 使 用 智能 手 
机 拍摄 区 域内 猪 只 图 像 实 现 生 猪 计 数 。 对 于 模型 错 
检 漏 检 的 猪 只 ， 人 允许 用 户 点 击 结果 图 像 中 错误 位 置 
修改 统计 结果 ， 以 进一步 提升 生猪 计数 的 准确 性 。 
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m MW 


(a) RBI (b) HI " — (DAXH2 (@) 修 改 图 2 
a. 计数 正确 b. 计数 误差 为 1( 错 检 , 红 色 框 处 ) 


A 
(a) 原 图 3 (b) 结 果 图 3 (c) 修 改 图 3 


c. 计数 误差 为 1( 漏 检 , 红 色 框 处 ) 
图 6 微 信 小 程序 实现 生猪 计数 结果 可 视 化 
Fig.6 Visualization of pig counting results in WeChat mini program 


#5 YOLOv8x-Ours 在 网 络 图 像 上 的 计数 结果 
Table 5 Counting results of YOLOv8x-Ours on network images 


准确 计数 的 误差 小 于 2 头 误差 小 于 3 头 误差 大 于 2 头 


重型 图像 数 量 ，” 猪 的 图 像 数量 猪 的 图 像 数 量 猪 的 图 像 数量 
YOLOv8- 
Ours 13 17 19 1 


相 比 现 有 生猪 计数 方法 ， 本 研究 无 需 在 猪 场 的 
养殖 区 域 上 方 架设 众多 成 像 设 备 ， 只 需 使 用 智能 手 
机 即 可 进行 生猪 计数 ， 且 用 户 可 以 通过 网 像 分 割 结 
果 快 速 辨 别 技术 结果 是 否 存在 错误 ， 对 于 错误 结 
可 便捷 地 进行 修改 ,使 得 本 人 研究 的 方法 更 易于 推广 
应 用 。 这 种 人 机 协作 的 模式 既 节 省 了 大 量 的 人 力 ， mm b. 样 例 2 
也 可 以 保证 计数 结果 的 可 靠 性 。 图 7 网 络 图 像 在 生猪 计数 微 信 小 程序 中 的 计数 结果 


Fig. 7 Counting results of web images in the pig counting 


利益 冲突 声明 : 本 研究 不 存在 研究 者 以 及 与 公开 
研究 成 果 有 关 的 利益 冲突 。 
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Abstract: 
[Objective] Currently, pig farming facilities mainly rely on manual counting for tracking slaughtered and stored pigs. This is not only 


time-consuming and labor-intensive, but also prone to counting errors due to pig movement and potential cheating. As breeding opera- 
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tions expand, the periodic live asset inventories put significant strain on human, material and financial resources. Although methods 
based on electronic ear tags can assist in pig counting, these ear tags are easy to break and fall off in group housing environments. 
Most of the existing methods for counting pigs based on computer vision require capturing images from a top-down perspective, ne- 
cessitating the installation of cameras above each hogpen or even the use of drones, resulting in high installation and maintenance 
costs. To address the above challenges faced in the group pig counting task, a high-efficiency and low-cost pig counting method was 
proposed based on improved instance segmentation algorithm and WeChat public platform. 

[Methods] Firstly, a smartphone was used to collect pig image data in the area from a human view perspective, and each pig's outline 
in the image was annotated to establish a pig count dataset. The training set contains 606 images and the test set contains 65 images. 
Secondly, an efficient global attention module was proposed by improving convolutional block attention module (CBAM). The effi- 
cient global attention module first performed a dimension permutation operation on the input feature map to obtain the interaction be- 
tween its channels and spatial dimensions. The permuted features were aggregated using global average pooling (GAP). One-dimen- 
sional convolution replaced the fully connected operation in CBAM, eliminating dimensionality reduction and significantly reducing 
the model's parameter number. This module was integrated into the YOLOV8 single-stage instance segmentation network to build the 
pig counting model YOLOv8x-Ours. By adding an efficient global attention module into each C2f layer of the YOLOv8 backbone net- 
work, the dimensional dependencies and feature information in the image could be extracted more effectively, thereby achieving high- 
accuracy pig counting. Lastly, with a focus on user experience and outreach, a pig counting WeChat mini program was developed 
based on the WeChat public platform and Django Web framework. The counting model was deployed to count pigs using images cap- 
tured by smartphones. 

[Results and Discussions] Compared with existing methods of Mask R-CNN, YOLACT(Real-time Instance Segmentation), PolarMask, 
SOLO and YOLOv5x, the proposed pig counting model YOLOv8x-Ours exhibited superior performance in terms of accuracy and sta- 
bility. Notably, YOLOv8x-Ours achieved the highest accuracy in counting, with errors of less than 2 and 3 pigs on the test set. Specifi- 
cally, 93.846 of the total test images had counting errors of less than 3 pigs. Compared with the two-stage instance segmentation algo- 
rithm Mask R-CNN and the YOLOv8x model that applies the CBAM attention mechanism, YOLOv8x-Ours showed performance im- 
provements of 7.6% and 3%, respectively. And due to the single-stage design and anchor-free architecture of the YOLOv8 model, the 
processing speed of a single image was only 64 ms, 1/8 of Mask R-CNN. By embedding the model into the WeChat mini program 
platform, pig counting was conducted using smartphone images. In cases where the model incorrectly detected pigs, users were given 
the option to click on the erroneous location in the result image to adjust the statistical outcomes, thereby enhancing the accuracy of 
pig counting. 

[Conclusions] The feasibility of deep learning technology in the task of pig counting was demonstrated. The proposed method elimi- 
nates the need for installing hardware equipment in the breeding area of the pig farm, enabling pig counting to be carried out effortless- 
ly using just a smartphone. Users can promptly spot any errors in the counting results through image segmentation visualization and 
easily rectify any inaccuracies. This collaborative human-machine model not only reduces the need for extensive manpower but also 
guarantees the precision and user-friendliness of the counting outcomes. 


Key words: pig counting; deep learning; WeChat mini program; YOLOv8; instance segmentation 
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